文本审核增强版检测URL风险

文本审核增强版升级检测能力,帮助用户识别第三方URL链接是否存在欺诈、色情、赌博等风险,守护平台内容生态。本文介绍文本审核用于检测URL风险的服务以及使用方法。

功能特性

文本审核增强版提供以下审核服务能够支持URL链接风险检测,在使用场景和特性上有所区别,请您根据业务特点选择匹配的服务。

使用场景

支持的文本审核服务

特性说明

适用于用户聊天或评论内容,同时识别文本内容和其中可能存在的URL链接风险。

服务名称:公聊评论内容检测

service:comment_detection

  • 该服务能够提取文字内容中包含的URL部分并进行检测。

  • 如果识别为风险链接,将返回标签 contraband(违禁内容),具体请参考 使用文本审核增强版识别文本违规风险

  • 该场景下,聊天或评论内容以文字为主,因此文字部分的风险特征权重会更高。

  • 该服务不支持返回URL相关的基础信息。

适用于应用内置浏览器,URL链接发布或者分享功能,短信内URL链接等场景,单独对URL链接进行风险检测。

服务名称:URL风险链接检测

service:url_detection

  • 本文档主要介绍该服务的返回参数,不同于其他文本服务。

  • 该服务仅适用于单独对URL链接进行检测的场景,要求输入内容符合URL格式,不能混合其他文字内容。

  • 基于系统标记的URL库和站点信息进行风险分析,如果识别为风险链接,将返回欺诈、赌博、色情等风险类型的标签值,同时支持返回URL相关的基础信息。

检测能力

文本审核增强版URL检测服务采用如下标签结构,能够在识别URL链接风险的同时返回其基础信息:

检测能力

说明

风险标签

  • sexual_url:疑似色情网站

  • gambling_url:疑似赌博网站

  • phishing_url:疑似钓鱼网站

  • other_risk_url:疑似欺诈和其他风险

  • unmarked_url:未被风险标记的或正常网站

基础信息

  • icpType:ICP备案类型

  • icpNo:ICP备案号

支持URL格式

文本审核增强版URL检测服务支持符合以下格式的URL地址:http(s)://{IP或域名}{:端口}{/路径}

说明
  1. URL地址可以没有HTTP或HTTPS前缀

  2. 域名部分是数字、字母组成,英文点号分隔,一级域名2-6个字母

  3. 端口部分支持1-4个数字

  4. 路径支持数字、字母、及常见字符,例如_!~*'().;?:@&=+$,%#-)等,不能有中文

如果输入URL地址不符合该格式,会返回错误码 BAD_REQUEST(400)。

计费说明

文本审核增强版服务支持按量后付费和资源包抵扣两种付费方式。

按量后付费

当您开通文本审核增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。

审核类型

支持的业务场景(服务)

计费单价

文本审核通用(text_standard)

URL风险链接检测:url_detection

7.5元/万次

资源包抵扣

如果您的审核量较大,或有相对固定的审核需求,建议预先购买资源包的方式。购买资源包规格越大,享受的折扣越大,支持叠加购买和使用。更多内容,请参见购买内容审核增强版抵扣资源包

该资源包用于内容审核增强版用量的抵扣,无法与内容安全流量包共享,具体的抵扣系数如下:

审核类型

支持的业务场景(服务)

抵扣系数

文本审核通用(text_standard)

URL风险链接检测:url_detection

抵扣系数为1,表示每成功调用一次接口,抵扣资源包的流量包容量规格1次。

例如购买的资源包的流量包容量规格为10次,当您成功调用1次接口,抵扣流量包容量规格1次,剩余9次。

接入指南

步骤一:开通服务

访问开通服务,开通文本审核增强版服务。

开通文本增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。接口接入使用后系统会按使用量自动出账,具体信息,请参见计费说明您也可以购买按量抵扣资源包,资源包相较于后付费存在一定阶梯折扣,适合使用量级可预期和较大的用户。

步骤二:为RAM用户授权

在接入SDK或者API之前,您需要为RAM用户授权。您可以为阿里云账号和RAM用户创建一个访问密钥(AccessKey)。在调用阿里云API时您需要使用AccessKey完成身份验证。获取方式,请参见获取AccessKey

  1. 使用RAM管理员登录RAM控制台

  2. 创建RAM用户。

    具体操作,请参见创建RAM用户

  3. 向RAM用户授权系统策略权限:AliyunYundunGreenWebFullAccess

    具体操作,请参见为RAM用户授权

    完成以上配置后,您可以使用RAM用户调用内容安全API。

步骤三:安装并接入SDK

目前支持的接入地域如下,文本审核增强版服务SDK请参考接入指南文本审核增强版通用服务部分。

地域

外网接入地址

内网接入地址

华东2(上海)

green-cip.cn-shanghai.aliyuncs.com

green-cip-vpc.cn-shanghai.aliyuncs.com

华北2(北京)

green-cip.cn-beijing.aliyuncs.com

green-cip-vpc.cn-beijing.aliyuncs.com

华东1(杭州)

green-cip.cn-hangzhou.aliyuncs.com

green-cip-vpc.cn-hangzhou.aliyuncs.com

华南1(深圳)

green-cip.cn-shenzhen.aliyuncs.com

green-cip-vpc.cn-shenzhen.aliyuncs.com

西南1(成都)

green-cip.cn-chengdu.aliyuncs.com

暂无

API

使用说明

业务接口:https://green-cip.{region}.aliyuncs.com

您可以调用该接口创建文本内容检测任务。关于如何构造HTTP请求,请参见请求结构;您也可以直接选用已构造好的HTTP请求,更多信息,请参见接入指南

  • 计费信息:

    该接口为收费接口。仅对HTTP状态码为200的请求进行计量计费,产生其他错误码时不会计费。关于计费方式,请参见计费说明

QPS限制

本接口的单用户QPS限制为100次/秒。超过限制,API调用会被限流,这可能会影响您的业务,请合理调用。

请求参数

名称

类型

是否必须

示例值

描述

Service

String

url_detection

审核服务类型。取值:

  • url_detection:URL风险链接检测

ServiceParameters

JSONString

审核服务需要的参数集。JSON字符串格式,关于每个字符串的描述见下表。

表 1. ServiceParameters

名称

类型

是否必须

示例值

描述

content

String

检测内容

审核的URL内容,限定在600字符以内。

accountId

String

10123****

账户ID,标识一个账户的唯一ID。

deviceId

String

20240307****

设备ID,标识一个设备的唯一ID。

deviceToken

String

MzQvo1d7scyZ3tl_RcJ******

通过风险控制SDK获取到的设备令牌。

返回参数

名称

类型

示例值

描述

Code

Integer

200

错误码。更多信息,请参见Code说明

Data

JSONObject

{"labels":"sexuality","reason":"..."}

审核结果数据,具体信息请参见Data

Message

String

OK

请求消息的响应消息。

RequestId

String

AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****

请求ID。

表 2.Data

名称

类型

示例值

描述

Labels

String

sexual_content

标签,多个标签用英文逗号(,)分隔。包括:

  • sexual_url:疑似色情网站

  • gambling_url:疑似赌博网站

  • phishing_url:疑似钓鱼网站

  • other_risk_url:疑似欺诈和其他风险

  • unmarked_url:未被风险标记的或正常网站

Reason

String

{\"icpType\":\"企业\",\"icpNo\":\"ICP备123456789\",\"score\":\"90\"}

更多信息的JSON字符串。包含以下字段:

  • icpType:ICP备案类型

  • icpNo:ICP备案号

  • score:风险分数

AccountId

String

10123****

账户ID。

说明

如果在检测请求参数中传入了accountId,则此处返回对应的accountId。

DeviceId

String

20240307****

设备ID。

说明

如果在检测请求参数中传入了deviceId,则此处返回对应的deviceId。

示例

请求示例

{
    "Service": "url_detection",
    "ServiceParameters": {
        "content": "http://aliyun.com/abc",
        "accountId": "10123****"
    }
}

正常返回示例

{
    "Code": 200,
    "Data": {
        "Labels": "unmarked_url",
        "Reason": "{\"icpType\":\"企业\",\"icpNo\":\"ICP123XXXX789\",\"score\":\"60\"}"
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Code说明

Code

状态代码

说明

200

OK

请求成功。

400

BAD_REQUEST

请求有误。可能是请求参数不正确导致,请仔细检查请求参数。

407

NOT_SUPPORT

无法识别或不支持该语种类型。

408

PERMISSION_DENY

可能是您的账号未授权、账号欠费、账号未开通、账号被禁等。

500

GENERAL_ERROR

错误。可能是服务端临时出错。建议重试,若持续返回该错误码,请通过在线服务联系我们。

581

TIMEOUT

超时。建议重试,若持续返回该错误码,请通过在线服务联系我们。

588

EXCEED_QUOTA

请求频率超出配额。